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Програмна система для моделювання 
ієрархічної комп'ютерної пам'яті 


Запропоновано імітаційну модель для моделювання протоколів когерентності. Визначено вихідні дані 
для моделювання ієрархічної комп'ютерної пам'яті. За результатами моделювання визначено кращий 
протокол для конкретного класу задач, що обчислюються в багатопроцесорному середовищі. 


Вступ 


Підвищення продуктивності обчислювальних систем безпосередньо пов'язане 
зі збільшенням швидкодії і ємності пам'яті. Ємність пам'яті найбільш великих 
обчислювальних систем зросла від 1000 байт до десятків терабайт, а час циклу 
зменшився з 20 мкс до 10 не. Швидкодіючі запам'ятовувальні пристрої залишаються 
більш дорогими, чим повільні. З метою зменшення вартості при тій же продуктивності 
ефективніше мати ієрархію пам'яті з невеликим за ємністю запам'ятовувальним 
пристроєм (1), розташованим поруч із процесором, що й мають мінімальний час 
доступу. Така ієрархія дозволяє узгодити характеристики пам'яті й центрального 
процесора. 

Оскільки швидкість процесорів та кількість ядер, що використовуються на 
сучасних пристроях, збільшується, актуальність кешу теж збільшується. 

Системи для аналізу роботи кешу ще не набули достатньої популярності. Крім 
того, існуючі зараз системи не дозволяють зазирнути у середину роботи процесора, 
можна проаналізувати лише загальні відомості про процесор та його кеш. 

Сучасні умови потребують систем, які б могли аналізувати ефективність кешу 
для різних класів задач, що обчислюються на багатопроцесорній або багатоядерній 
техніці. 

Мета роботи полягає в розробці програмної системи, за допомогою якої можна 
аналізувати ефективність кешу для різних класів задач, що обчислюються на багато- 
процесорній або багатоядерній техніці. 


Підтримка когерентності кеш-пам'яті 


При використанні ієрархічної пам'яті для кожного елемента даних повинна 
бути забезпечена когерентність (погодженість, однаковість) його копій, у різних 
рівнях ієрархії. Для багатопроцесорної ЕОМ справа ускладнюється й тим, що одні Й 
ті ж дані можуть вимагатися різними процесорами. 

Реалізація механізму когерентності в ОМ із розподіленою пам'яттю вимагає 
апаратурно-тимчасових витрат. Зменшити тимчасову складову витрат можна за рахунок 
збільшення апаратурної складової і навпаки. Зменшення тимчасової складової вимагає 
створення спеціалізованої апаратури реалізації когерентності. Зменшення апаратурної 
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складової передбачає деякий мінімум апаратних засобів, на яких здійснюється 
програмна реалізація механізму когерентності. Розглянемо деякі протоколи. 

Для забезпечення когерентності пам'яті моделі із роздільними кешами й 
загальною пам'яттю можна використовувати алгоритм МЕ5ЗІ (МоаїПеа, Ехсіивіуе, 
ЗПагей, ШуаПа) |2). Він являє собою організацію когерентності кеш-пам'яті зі зворот- 
ним записом. Цей алгоритм запобігає зайвим передачам даних між кеш-пам'яттю й 
основною пам'яттю. Так, якщо дані в кеш-пам'яті не змінювалися, то нема чого їх 
пересилати. 

Кожний рядок кеш-пам'яті може перебувати в одному з наступних станів: М -- 
рядок модифікований (доступний до читання й запису тільки в цьому ОМ, тому що 
модифікований командою запису порівняно з рядком основної пам'яті); Е - рядок 
монопольно копійований (доступний до читання й запису в цьому ОМ і в основній 
пам'яті); 5 - рядок багатокопійований або розподілений (доступний до читання й 
запису в цьому обчислювальному модулі (ОМ), в основній пам'яті й у кеш-пам'яті 
інших ОМ, у яких утримується її копія); / - рядок, неможливий до використання 
(рядок не доступний ні до читання, ні до запису). 

Стан рядка використовується як для визначення процесором ОМ можливості 
локального, без виходу на шину, доступу до даних у кеш-пам'яті, так і для керування 
механізмом когерентності. 

Для керування режимом роботи механізму підтримки когерентності використо- 
вується біт МТ, стан 1 якого задає режим наскрізного (уутіїе-їргоцеП) запису, а стан 0 - 
режим зворотного (уугіе-БасК) запису в кеш-пам'ять |21. 

При виконанні команд читання й запису стан рядка кеш-пам'яті, до якого 
виконується доступ, визначається МЕ51-діаграмою |21. 


Рисунок 1 - МЕЗІ-діаграма забезпечення когерентності кеш-пам'яті 
у діагр р 


Алгоритм підтримки когерентності пам'яті МОЕЗІ дозволяє уникнути необхідності 
запису змін із кеш-пам'яті в основну для дозволу іншому процесору їх читання завдяки 
стану Оутеа, в якому процесор передає модифіковані дані безпосередньо в інший 
процесор. 

В стані Оумтеа містяться коректні дані. Тільки один із процесорів може мати 
дану кеш-лінію в стані Оумтеа, усі інші процесори можуть мати ці дані тільки в 
стані 5. Зміна стану за даним протоколом наведена в |31. 

Стан Оутеа надав всі переваги процесору-хазяїнові, але інші процесори в поло- 
женні тільки для читання. А якщо кому-небудь із них було необхідно зробити запис 
у свій рядок зі станом 5, то доводилося робити її й в оперативну пам'ять, що приво- 
дило до ліквідації стану Омтеа в іншого процесора. У багатопотокових середовищах, 
де різні процесори або процесорні ядра можуть одночасно виконувати різні потоки 
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того самого процесу, це представляє проблему. Для поліпшення продуктивності в 
цьому випадку уведений стан И/йеп в алгоритмі підтримки когерентності пам'яті 
МОУУЕЧІ. При записі в рядок зі станом 5 він змінювався на Й йпеп, інші процесори 
сповіщалися про факт і зобов'язувалися ліквідувати або обновити свої застарілі 
копії, після чого стан рядка змінювався на М або Омтеа. 


Реалізація та тестування моделі 


Загальний алгоритм роботи кожного кешу обчислювального модуля в моделі 
наведено на рис. 2. Квант модельного часу дорівнює такту процесора. Вихідні дані для 
моделі наступні: г - вірогідність читання; 1-г - вірогідність запису; р - вірогідність 
влучення до кешу; 1-р вірогідність невлучення до кешу; вірогідності знаходження 
даного в станах М, О, Й, Е, 5, І (в залежності від класу задач, що обчислюються), 
ємність кешу. Реалізовано три алгоритми підтримки когерентності пам'яті: МЕЧІ, 
МОЕЗЧЗІ, МОУУЕЧЗЧІ. 


если ХЛер) О. 
// данного в кзш нет 
Определениє статуса данного. 
Пересьилка данного из ОП или другого кош. 
Обработка данного (чтение/запись) по протоколу. 
Изменениєе статуса данного. 


Иначе 


// данное в кзш 

Определение статуса данного. 

вели «Е) то 

Чтение данного по соотв.протоколу. 

Изменениє статуса данного. 

Иначе 
Запись данного в соответствий с протоколом. 
Изменениє статуса данного. 


Рисунок 2 - Загальний алгоритм роботи кеш 


Як тестовий процесор був обраний Пе! Соге 15 |4| як один з найпопулярніших 
на цей час. 

На рис. 3 наведено середній час обробки заявки (в тактах). В цьому тесті однакова 
вірогідність находження даного в різних станах (для спрощення), що не зовсім відпо- 
відає дійсності, тому середній час великий. З рисунку видно, що в цьому випадку 
кращим протоколом є МОМУЕЗІ, завдяки зменшенню часу обміну з оперативною 
пам'яттю. Тестування моделі ускладнюється багатьма параметрами вихідних даних. 


Висновки 


Проаналізоване функціонування протоколів кешів для багатопроцесорних систем. 
Зроблено висновок, що чим складніший є процесор, тим більш складного протоколу 
когерентності він потребує. Розроблена 1 протестована модель для різних протоклів 
когерентності. 
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Рисунок 3 - Середній час обробки заявки 


В подальшому планується розширити кількість протоколів, що підтримуються 
програмою, а також кількість процесорів, що можуть бути промодельовані. Є можли- 
вість доопрацювання системи для моделювання поведінки кешу будь-якої системи, 
що містить кеш. 

Подальші дослідження направлені на аналіз ефективності кешу відповідно 
класу задач, що обчислюються на паралельній техніці. 
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Т.В. Михайлова 

Программная система для моделирования иерархической памяти 

Предложена имитационная модель для моделирования протоколов когерентности. Определеньт исходньве 
данньєе для моделирования иерархической компьютерной памяти. По результатам моделирования вьгбран 
лучший протокол для конкретного класса обрабатьтваємьтх задач. 


Т.У. МіКпауіоуа 

Ргосгатт Зузєет Їог Модеїйпе Ніегагспіса! Метогу 

Тре вітиіайоп тоайе! 15 зарсезіва Бог плодейнпе ргоіосої ої аа 58їогаєе. Каму Чаїа Гог плодейпє Біегагсрісаї! 
соприєт тепогу 15 декегтіпед. ТБе Безі ргоїосої 15 сбобеп оп Бе гебиї ої плодейпе сегіаїп гуре ої Бе 
ргосе55ей ргобіетея. 


Стаття надійшла до редакції 14.07.2010. 
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